20 mars 2026
Théorème 1 (Biais de l’estimateur par substitution) Si l’estimateur d’Horvitz-Thompson \(\hat{t}_{y,\text{HT}}\) est sans biais pour \(t_y\) alors \(\mathbb{E}(f(\hat{t}_{y,\text{HT}})) - f(t_y) \approx 0\).
Théorème 2 (Estimation de la variance par linéarisation - cas unidimensionnel) L’estimateur de la variance par linéarisation d’une fonction d’intérêt de la forme \(f(t_{y})\) est donné par \(\displaystyle \hat{\mathbb{V}}_\text{lin}(f(\hat{t}_{y,\text{HT}})) = \mathbb{V}(\hat t_{\hat{u},HT})\)
Il reste à utiliser les résultats propres au plan de sondage afin de déterminer un estimateur de la variance.
où la variable \(\{u_k\}_{k \in \mathcal{U}}\) est définie pour tout \(k \in \mathcal{U}\) par \(u_k = \nabla f(t_{y^1}, ..., t_{y^d}) (y^1_k, ..., y^d_k)^T\)
\(\to\) utilisation de la variable linéarisée estimée : \(\hat u_k = \nabla f(\hat{t}_{y^1,\text{HT}}, ..., \hat{t}_{y^d,\text{HT}}) (y^1_k, ..., y^d_k)^T\).
Théorème 3 (Estimation de la variance par linéarisation) L’estimateur de la variance par linéarisation d’une fonction d’intérêt de la forme \(f(t_{y^1}, ..., t_{y^d})\) est donné par \(\displaystyle \hat{\mathbb{V}}_\text{lin}(f(\hat{t}_{y^1,\text{HT}}, ..., \hat{t}_{{y^d,\text{HT}}})) = \mathbb{V}( \nabla f(\hat{t}_{y^1,\text{HT}}, ..., \hat{t}_{{y^d},\text{HT}}) ( \hat{t}_{y^1, \text{HT}} , ..., \hat{t}_{y^d,\text{HT}})^T)\)
Supposons que nous disposons de deux variables d’intérêt \(y^{(1)}\) (par exemple, la part de transferts sociaux) et \(y^{(2)}\) (par exemple, le revenu total) et que nous souhaitons connaître un estimateur du ratio des totaux \(R_{y^{(1)}, y^{(2)}} = \frac{t_{y^{(1)}}}{t_{y^{(2)}}}\).
L’estimateur par subtitution de \(R_{y^{(1)}, y^{(2)}}\) noté \(\hat{R}_{y^{(1)}, y^{(2)}, \text{sub}}\) est donné par \(\hat{R}_{y^{(1)}, y^{(2)}, \text{sub}} = \frac{\hat{t}_{y^{(1)},\text{HT}}}{\hat{t}_{y^{(2)},\text{HT}}}\) .
Cet estimateur est approximativement sans biais (le biais est d’autant plus faible que les estimateurs des totaux ont une faible variance et que la fonction d’intérêt ne fluctue pas trop - on suppose que pour tout \(k \in \mathcal{U}, \pi_k > 0\)).
Quid de la variance ?
\(f : (x,y) \in \mathbb{R} \times \mathbb{R}^* \to \frac{x}{y}\)
Pour tout \((x,y) \in \mathbb{R} \times \mathbb{R}^*\), \(\nabla f(x,y) = (\frac{1}{y}, \frac{-x}{y})\)
La variable linéarisée pour un individu \(k\) vaut donc \(u_k = \frac{y^{(1)}_k}{t_{y^{(2)}}} - \frac{t_{y^{(1)}}}{t_{y^{(2)}}^2} y^{(2)}_k = \frac{1}{t_{y^{(2)}}} (y^{(1)}_k - R_{y^{(1)}, y^{(2)}} y^{(2)}_k)\)
La variable linéarisée estimée pour un individu \(k\) vaut \(\hat{u}_k = \frac{1}{\hat{t}_{y^{(2)},\text{HT}}} (y^{(1)}_k - \hat{R}_{y^{(1)}, y^{(2)},\text{sub}} y^{(2)}_k)\)
L’estimateur de la variance par \(\mathbb{V}(\hat{R}_{y^1, y^2, \text{sub}})\) est approximativement \(\mathbb{V(\hat{t}_{\hat{u}, \text{HT}})}\) où \(\hat{u}_k = \frac{1}{\hat{t}_{y^{(2)},\text{HT}}} (y^{(1)}_k - \hat{R}_{y^{(1)}, y^{(2)},\text{sub}} y^{(2)}_k)\).
Comment utiliser la linéarisation pour estimer la variance d’un estimateur par subtitution?
On souhaite obtenir une estimation de la variance de \(f(t^1_y,..., t^d_y)\) où \(f : \mathbb{R}^d \to \mathbb{R}\)